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摘要 : 含 WD 重复 功能 域 的 蛋白 能 够 参与 信号 传导 、 转 录 调 控 、RNA 剪 切 、 细 胞 的 凋 亡 等 多 种 功能 ， 在 
病原 菌 与 寄主 植物 蛋白 互 作 的 过 程 中 扮演 着 要 的 角色 。 本 研究 分 析 了 稻 辣 病菌 基因 组 中 94 个 WD 功能 
域 基因 编码 区 和 调控 区 中 SSR 的 组 成 、 分 布 ， 并 检测 了 7 个 蛋白 编码 区 中 SSR 的 变异 及 其 对 蛋白 二 级 结 
构 的 影响 。 结 果 表 明 ，WD 功能 域 基因 的 编码 区 和 调控 区 中 都 含有 大 量 的 SSR， 但 是 SSR 在 这 些 基因 的 外 
显 子 区 、 内 含 子 区 、5'-UTR 和 3'-UTR 区 中 SSR 的 组 成 和 分 布 均 不 相同 ; 编码 区 中 三 碱 基 和 六 碱 基 SSR 分 
布 较 多 ， 这 些 SSR 基 序 大 都 表现 为 GC 含量 较 高 和 其 所 编码 的 杂 水 性 氨基 酸 出 现 的 频率 远 远 高 于 玻 水 性 氨 
基 酸 的 特点 。 sv e 富 的 多 态 性 ， 通 过 Antheprot 
(DPM) 软件 预测 发 现 : SSR 的 变异 对 蛋白 的 二 级 结构 有 一 定 影响 。 这 暗示 着 SSR 的 变异 对 致 病 相 关 基 因 
的 变异 起 着 十 分 重要 的 作用 。 

关键 词 : 稳 瘟 病菌 ; 微 卫星 重复 序列 ，WD 重复 功能 域 ; 蛋白 二 级 结构 

中 图 分 类 号 : Q 75 文献 标识 码 : A 文章 编号 : 2095-0845(2011)04-376-07 





















































































































































SSR Variation in the WD Repeats Domain Genes and It's Effects 
on Protein Structure of Rice Blast Fungus, Magnaporthe oryzae 


LIU Lin, LI Cheng-Yun " , GAO Yuan, YANG Jing, ZHA You-Gui, HU Yan-Ling 
( Key Laboratory of Agro-Biodiversity and Pest Management of Education Ministry of China, National 
Engineering Research Center Agro-Biodiversity Applied Technology, Kunming 650201, China) 


Abstract: WD repeats domain containing genes can participate in signal transduction, transcriptional regulation, 
RNA splicing and apoptosis and so on. WD repeats domain containing genes play important roles in plant-pathogen 
interactions. SSR component and distribution in coding and regulation region of 94 WD repeats domain containing 
genes were analyzed in Magnaporthe oryzae, and the SSR variation in 7 coding regions of WD repeats domain contai- 
ning genes was checked and analyzed its effect on secondary structure of protein. The result showed that abundance 
of SSRs were in the coding region and regulation region of WD repeats domain containing genes, but both SSR com- 
ponent and distribution were different among extron, intron, 5'-UTR and 3'-UTR ; tri-nucleotide and hexa-nucleotide 
SSR in coding region were more than other region, and the frequency of hydrophilic amino acids was relatively high- 
er. In additional, 7 SSR loci of coding region including SSR were polymorphism, and SSR polymorphism of these lo- 
ci can affect the secondary structure of protein. The data of this study indicated that the mutation of SSR might play 
an important role for pathogenic gene mutation. 
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WD 重复 功能 域 是 一 类 含有 多 个 高 度 保守 的 
WD 基 元 的 蛋白 质 。 该 类 蛋白 质 家 族 参 与 了 信和 号 
传导 、 转 录 调 控 、RNA 剪 切 、 细 胞 凋 亡 、 细 胞 骨 
架 合 成 、 纺 锤 体 的 形成 和 液 泡 的 物质 交换 等 多 种 
功能 (Nakayama 等 , 1997; Cerna 和 Wilson, 2005 ; 
Welcker 和 Clurman, 2008; Hopfer 等 ,2006; Lau 
等 , 2009) 。 刘 红 美 等 (2007) 用 RNA 干涉 对 水 
稻 WD 结构 域 基因 的 功能 研究 表明 ， 水 稻 中 含有 
WD 结构 域 的 基因 可 能 参与 了 水 稻 的 再 分 化 以 及 
水 稳 性 央 官 的 发 育 调控 等 功能 。 可 见 含 WD 功能 
域 的 基因 在 生物 体 中 具有 重要 的 调节 作用 。 但 是 
ACT REGEM VR WD 功能 域 基因 的 研究 尚未 见报 道 。 

SSR 是 指 由 单 、 双 、 三 、 四 、 五 和 六 核 苷 酸 
重复 单元 串联 排列 的 简单 重复 序列 。 无 论 是 原核 
生物 还 是 真 核 生 物 基因 组 中 都 有 SSR 分 布 ， 其 
性 质 由 重复 单元 的 组 成 、 长 度 及 其 在 基因 组 中 的 
位 置 决定 。 早 期 人 们 均 认 为 SSR 序列 为 垃圾 序 
列 。 但 是 随 着 对 SSR 序列 研究 的 不 断 深 入 ， 人 
们 改变 了 这 一 看 法 。 近 来 ,已 有 研究 表明 无 论 是 
在 基因 的 编码 区 ， 还 是 调控 区 ，SSR 的 扩张 或 收 
缩 能 够 导致 基因 功能 的 丧失 或 获得 ， 或 者 通过 影 
响 转 录 或 翻译 水 平 而 对 基因 的 表达 进行 调节 等 
(Li 等 , 2004; Cummings 和 Zoghbi, 2000; Rocha 
和 Blanchard, 2002), TU TE WE ELTE 25 48 X 
中 ， 和 蛋白 激酶 3'-UTR 的 CTG 三 碱 基 重 复 大 于 50 
次 重复 时 将 会 降低 蛋白 激酶 的 活性 ， 进 而 影响 
RNA 的 表达 ， 导 致 肌 强 直 性 萎缩 疾病 的 发 生 
(Amack 和 Mahadevan, 2001; Seznec 等 ,2001 ) 。 
编码 区 中 SSR 的 扩张 或 收缩 对 基因 功能 的 影响 
能 够 引起 胚 系 的 不 稳定 性 和 体 细 胞 的 易 变性 
(Zoghbi 和 Orr, 2000) 等 。 但 是 ，SSR 的 扩张 或 
收缩 对 基因 功能 的 影响 也 仪 在 一 些 SSR 变异 与 
人 类 疾病 和 酵母 相关 的 研究 中 有 报道 ， 而 在 植物 
致 病 性 真菌 中 尚未 见报 道 。 

稻 瘟 病 是 世界 水 稳 生 产 上 的 主要 病害 ， 且 是 
研究 病原 物 一 植物 相互 作用 的 模式 系统 之 一 。 稳 
瘟病 菌 和 水 稻 基 因 测 序 的 完成 ， 为 研究 稳 瘟 病菌 
与 水 稻 的 互 作 提供 了 很 好 的 平台 。 第 五 版 基因 
注释 的 稻 间 病菌 基因 组 序列 的 全 长 为 38.8 Mb 
(Dean 等 , 2005), ， 编 码 蛋 白质 的 开放 阅读 框架 
(ORF) 共 12 841 个 , 最 新 公布 的 基因 编码 区 
的 总 长 为 19 888 236 bp， 占 整个 基因 组 序列 的 




















47.8% 。 作 者 利用 这 些 序列 ， 采 用 软件 和 手工 查 
找 相 结合 的 方式 ， 分 析 了 含 WD 功能 域 的 基因 序 
列 以 及 这 些 基 因 上 下 游 各 1 000 bp 范围 的 核 背 酸 
序列 ， 对 其 中 大 于 15 bp， 且 匹配 值 大 于 8096 的 
SSR 进行 了 系统 分 析 ， 并 对 这 些 基 因 中 SSR 与 
功能 域 之 间 的 位 置 关 系 进 行 了 分 析 ， 在 此 基础 
上 ， 初 步 分 析 了 SSR 的 扩张 或 收缩 对 蛋白 二 级 
结构 的 影响 。 为 揭示 稻 瘟 病菌 WD 功能 域 基因 编 
码 区 中 SSR 的 变异 对 基因 功能 的 潜在 影响 奠定 
了 基础 。 











1 材料 与 方法 
1.1 材料 

本 研究 所 使 用 的 材料 是 从 第 五 版 公布 的 组 成 稻 冶 病 
菌 的 12 841 个 基因 中 ， 预 测 为 含 WD 功能 域 的 基因 的 全 
部 核 苷 酸 序 列 和 其 上 下 游 各 1 000 bp KERFI; 以 
及 这 三 类 基因 的 氨基 酸 序列 。 通 过 http://www. broad. 
mit. edu/annotation/genome/magnaporthe, oryzae/ 网 站 下 载 
核 苷 酸 序列 和 氨基 酸 序列 。 
1.2 方法 
1.2.1 SSR 的 组 成 及 分 布 频率 分 析 本 人 研究 利用 Gary 
Benson 博士 编写 的 专门 程序 (Benson，1999) ， 以 大 于 
15 bp， 匹 配 值 为 80% ( 指 前 后 2 个 重复 单元 中 相 匹 配 的 
碱 基数 在 80% ) 的 标准 进行 查找 后 ， 对 互相 重 若 和 出 现 
遗漏 的 部 分 进行 人 工 校正 和 补充 。 为 叙述 方便 ， 本 研究 
将 所 有 可 循环 的 序列 及 与 其 互补 的 序列 归 为 一 类 。 即 : 
将 一 核 昔 酸 重复 序列 归 为 A、C 两 类 ; 二 核 昔 酸 重复 序 
列 归 为 AC、AG、AT 和 CG4 类 ,3 核 背 酸 重 复 序列 归 为 
10 类 ; 4 核 苷 酸 重 复 序列 归 为 33 类 ; 5 核 苷 酸 重复 序列 
归 为 102 25; 6 核 背 酸 重 复 序列 可 归 为 350 类 。 如 3 核 
ERER IIP, AAG 基 序 代表 了 所 有 AAG, AGA, 
GAA, CTT, TCT 和 TTC 的 SSR 序列 。 
1.2.2 SSR 的 变异 对 基因 功能 的 初步 分 析 利用 Map 
Chart 2. 1 对 编码 区 中 含有 SSR 的 基因 进行 SSR 和 功能 域 
之 间 的 位 置 关系 进行 定位 ， 再 用 7 对 本 课题 组 开发 设计 
的 具有 较 高 稳定 性 的 SSR 引物 对 采 自 云南 省 不 同 地 区 的 
48 个 稳 瘟 病菌 进行 SSR 位 点 变异 的 分 析 ， 在 此 基础 上 通 
过 Antheprot (DPM) (Deléage 等 , 2001) 对 SSR 的 扩张 
或 收缩 对 基因 的 二 级 结构 的 影响 进行 了 分 析 ， 初 步 推 测 
SSR 的 变异 对 含 WD 重复 功能 域 蛋 白质 结构 的 影响 。 























































































































2 结果 与 分 析 
2.1 SSR 的 组 成 及 分 布 频率 
根据 http://www. broad. mit. edu/annotation/ 
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genome/ magnaporthe_oryzae/ 网 站 公布 的 12841 个 
稻 瘟 病菌 的 ORF 和 对 基因 功能 的 预测 ， 共 找到 
94 个 含 WD 功能 域 的 基因 。 其 中 80 个 含 WD E 
复 功 能 域 的 基因 中 含有 内 含 子 1 ~7 个 不 等 ( 共 
有 内 含 子 198 个 ) 。 在 这 些 基因 的 编码 区 、 内 含 
子 区 以 及 5'-UTR 和 3'-UTR 区 中 都 含有 丰富 的 
SSR ( 表 1)。 在 94 个 基因 中 有 55 个 基因 的 编码 
区 或 调控 区 都 含有 SSR (JE 113 个 ) ， 约 占 该 类 
基因 总 数 的 58.5% ， 在 这 些 含 有 SSR 的 基因 中 ， 
平均 每 个 基因 或 基因 的 调控 区 至 少 含有 两 个 
SSR。 但 是 ，SSR 在 这 类 基因 的 编码 区 及 其 调控 
区 中 SSR 的 分 布 是 不 均一 的 ， 在 5'-UTR 的 数量 
RL, 共 38 个 ; 其 次 为 3'-UTR， 共 37 个 ; 内 
含 子 区 最 少 ,， 仅 11 个 。 而 且 各 种 重复 类 型 的 SSR 
在 基因 编码 区 、 内 含 子 区 以 及 5'-UTR AI 3'-UTR 
区 的 分 布 也 不 均一 。 单 碱 基 、 二 碱 基 、 四 碱 基 和 
五 碱 基 SSR 在 基因 的 调控 区 (5'-UTR, 3'-UTR 和 
内 含 子 区 ) 分 布 最 多 ， 而 在 基因 的 外 显 子 区 均 未 
检测 到 SSR; 在 基因 的 外 显 子 区 三 碱 基 和 六 碱 基 
SSR 分 布 最 多 ， 在 基因 的 调控 区 分 布 都 较 少 。 

从 表 2 中 可 见 ，20 个 含 WD 重复 功能 域 的 






































SSR 有 15 个 ， 三 碱 基 SSR 有 12 个 ， 均 未 检测 到 
单 碱 基 、 二 碱 基 、 四 碱 基 和 五 碱 基 SSR。 其 中 完 
整 的 SSR 有 7 个 ， 其 匹配 值 均 为 100% ， 其 余 的 
为 非 完 整 SSR， 其 匹配 值 均 在 S596 以 上 。 在 三 
碱 基 SSR F, KRT AAG (MGG 04802.5) 外 ,其 
它 的 三 碱 基 SSR 均 存 在 G+C 含量 较 高 的 特点 ; 
在 六 碱 基 SSR 中 ，G+C 含量 大 于 50% 的 SSR 共 
有 9 个 ， 占 六 碱 基 SSR 总 数 的 64% DA E, 在 
SSR 所 编码 的 氨基 酸 中 ， 天 冬 氨 酸 (D) 最 多 ， 
其 所 占有 的 基因 数 也 最 多 ， 共 有 10 个 ， 其 它 依 
次 为 : 谷 氨 酸 (E) 6^, FHAR (G) 5 个 ， 
KAR (A) MMAR (K) 各 4 个 ,丝氨酸 
(S) A, WAR (T), AR (R) MEAR 
(L) 2^, WAR (P) 1 个 。 从 SSR 编码 的 
ARRA, KEAR h MRY e TK 
性 氨基 酸 出 现 的 频率 。 
2.2 SSR 的 变异 及 其 功能 分 析 

为 了 分 析 SSR 的 变异 对 含有 WD 重复 功能 
域 基因 功能 的 影响 ， 本 研究 用 采 自 云南 省 不 同 稻 
区 的 48 个 稻 疗 病菌 菌株 ， 检 测 了 7 个 含 WD E 
复 功 能 域 基因 中 含 SR 位 点 区 域 的 多 态 性 ， 初 步 
































基因 编码 区 中 共 含 有 27 个 SSR， 其 中 六 碱 基 ”分 析 含 SSR 位 点 的 变异 情况 (图 1)。 测 量 各 片 


表 1 SSR 在 WD 功能 域 不 同 基因 中 的 分 布 


Table 1 The distribution of SSR sequence within different regions of WD repeats domain genes in Magnaporthe oryzae 




















区 域 FEREZ BEREZ 。 三 核 芽 酸 重复 WUEHREGEE MBERE 。 六 核 芋 酸 重复 ”合计 
Region Mono-nucleotide Di-nucleotide Tri-nucleotide Tetra-nucleotide Penta-nucleotide Hexa-nucleotide Total 
外 显 子 Extron 0 0 12 0 0 15 27 
5'-UTR 21 5 6 3 0 3 38 
3'-UTR 23 3 5 5 1 0 37 
内 含 子 Intron 7 1 0 1 2 0 11 


MCK1234 $5 


6 7 8 9 10 11 12 13 14 15 16 17 18 


123456 7 8 9111213141516 47181920 2122232125 26 2728 2930 3132333435 3637 3839 40 4142 424445 M 


2000 bp 500 bp 
1000 bp 
750 bp 
500 bp 
250 bp Vn 
50 bp 


100 bp 
































A: 琼脂 糖 凝 胶 电 泳 图 B: HEADS BEES FB UK E] 
图 1 引物 MGG06387 f S Re BE REUBE Fb, Yk EA R PT ts PUR EB E VK EI 
M 为 分 子 量 标记 ， 片 段 大 小 依次 为 100、250、500、750、1 000 $812 000 bp; 图 A 中 1~18 为 稳 癌 病菌 样品 扩 增 产物 ， 
CK 为 阴性 对 照 ; 图 B 中 1 ~45 为 稻 瘟 病菌 样品 扩 增产 物 
Fig.1 The Spectrum of polyacrylamide gel electrophoresis of both primers MGG06387 
M means marker DL-2000 whose size was 100 bp, 250 bp, 500 bp, 750 bp, 1 000 bp and 2 000 bp respectively; 1—18 standed 









































for DNA samples and ck standed for Negative control in figure A. 1—45 standed for DNA samples in figure B 
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R2 MEAR WD 功能 域 基因 的 编码 区 中 SSR 的 分 布 及 其 编码 的 氨基 酸 情况 
Table 2 SSR distribution and coding amino acid in the coding-region of WD repeat domain in Magnaporthe oryzae 
E " SSR 长 度 SSR 在 基因 中 的 匹配 值 
基因 编号 # SSR 基 序 氨基 酸 序列 ， bs 在 基因 中 的 An 
c od Motif of SSR S Pus id SSR repeats 起 始 位 置 Percent match 
sene code otif of SS equence of amino acid (bp) SSR start codon (%) 
MGG_ 03198. 5 CATCGG DA DA DA DA DA DAD 40 865 95 
MGG. 04802. 5 AAG KKKKKKSKK 27 846 93 
TCG P DDDDD 18 2567 89 
MGG- 033872 CCT EEDDDEE 23 2621 87 
MGG_ 08345. 5 GAC TTTV TTT 21 87 90 
MGG. 01711. 5 TCG DDDDD 15 1390 100 
AGG QDEEEE 17 1414 94 
MGG YHA: TCGCGC SRSRSRS 20 409 95 
MGG. 02743. 5 TCC EEEEEEEEEEE 32 172 97 
MGG_ 14350. 5 CGG GGGPG 15 418 87 
MGG_ 05325. 5 GGC GGGGGGG 23 19 91 
MGG. 06100. 5 GGC GGGGGG 18 4394 100 
GTC DDDDDDD 21 3443 95 
MGG. 00590. 5 TCCTTT DKDKDKDKD 23 1627 100 
TCCTTG KEKEKEK 20 1612 100 
TTTTCC G KEKEKEKE 26 3252 96 
Menem TGGTGC TG TSTS 18 3230 94 
MGG. 08178. 5 TCCTGC LLL RL R 18 2653 94 
MGG_ 09313. 5 TCATCC EDEDEDEDE 26 151 92 
MGG. 06387. 5 GAGTCG DSDSDS 18 237 100 
MGG. 06389. 5 CAAGCT LELELE 18 2291 100 
GGC AAAAAA 19 2968 89 
MGG=02303,3 GTCTTC DDEDED 18 1234 94 
GGATGG DGDGE 19 699 95 
M 03150. 5 SA 
co: CCCCCG RAAGAG 19 10 95 
MGG. 08829. 5 CCGCCC PPPPPPP 20 684 100 
MGG. 10590. 5 GCGCCG SAGAGG 18 331 94 























DE. # 字体 加 粗 的 基因 为 稳 瘟 病菌 基因 组 中 新 老 版 本 中 功能 预测 相同 且 SSR 位 点 发 生变 异 的 基因 ; 




















* 下 划 线 的 为 亲 水 性 氨基 酸 ， 字 体 加 粗 为 未 分 类 的 氨基 酸 ， 其 余 为 琉 水 性 氨基 酸 


Note: # The gene of overstriking letter means that the fifthly published genes are same as fourthly published genes and the SSR locus are instable; 


* underline is hydrophilic amino acid; overstriking letter is not classified amino acid; others are hydrophobic amino acid 


段 距 上 样 孔 的 距离 ， 并 通过 Marker 计算 出 各 片 
段 的 大 小 ， 将 其 与 已 测序 菌株 70-15 的 片段 大 
小 进行 比较 ， 其 结果 表明 (R3), 在 所 检测 的 
含有 SSR 的 位 点 均 发 生 了 变异 ,变异 的 幅度 在 
13 «46 bp 之 间 。 若 发 生 的 变异 均 为 SSR 的 扩张 
或 收缩 引起 ， 那 么 这 些 SSR 扩张 或 收缩 与 用 于 
基因 组 测序 且 已 公布 序列 的 菌株 70-15 相 比 ， 
其 重复 次 数 增加 或 减少 了 3 ~15 次 。 尤 其 发 生变 
异 的 MGG06387.5 发 生变 异 的 位 点 在 基因 的 功能 
域内 (图 2)。 

为 更 好 地 理解 SSR 的 重要 性 ， 仔细 分 析 了 








基因 编码 区 中 SSR 与 功能 域 之 间 的 位 置 关 系 。 
从 图 2 SSR 与 各 基因 功能 域 的 位 置 关系 可 以 看 
出 ，SSR 与 功能 域 之 间 的 位 置 没有 固定 的 模式 。 
有 些 SSR 分 布 离 功能 域 较 远 ， 如 MGG_10995. 5 
和 MGG_03597.5 等 ， 有 些 很 近 ， 如 MGG_02743. 5 
fll MGG. 05325. 5 等 ， 有 些 则 直接 分 布 在 功能 域 
内 ， 如 MGG_04473.5 和 MGG_06387.5 等 4 个 。 
位 于 NN 端 ， 与 起 始 密 码 子 相差 小 于 100 bp 的 基 
KA MGG_03150. 5 (10 bp), MGG_05325. 5 
(19 bp) 和 MGG_08345.5 (87 bp) 共 3 个。 男 
外 SSR 在 编码 区 的 数量 表现 为 1 ~3 个 不 等 ， 最 
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多 的 为 在 基因 编码 区 含有 一 个 SSR 的 基因 ， 共 
^ 14^"; 其 次 为 含有 二 个 SSR 的 基因 ,共有 5 
^; 最 少 的 为 含有 三 个 SSR 的 基因 ， 有 1 个。 














位 于 C 端 ， 与 终止 密码 子 相 差 不 超过 100 bp 的 
有 MGG_00590. 5 和 MGG. 06389. 5 , 
根据 试验 结果 ( 表 3) ， 估 算出 SS 发 生变 异 


表 3 不 同位 点 中 SSR 的 变异 情况 
Table 3 The variation of SSR in different loci 


参考 序列 产物 大 小 


实际 产物 大 小 





最 大 增加 重复 次 数 。” 最 小 减少 重复 次 数 







































































































































































n LA 
基因 编号 SSR 基 序 m 
G i Motif of SSR Identified product Reference sequence Largest repeat- Smallest repeat- 
ene code otii o 
size (bp) product size (bp) added decreased 
MG00590 GAC 335 ~ 375 329 15 0 
MG01711 CGA 280 ~ 305 293 4 4 
MG02743 GAG 240 ~ 280 260 6 6 
MG03150 GGATGG 237 ~273 255 3 3 
MG06387 CGACTC 242 ~255 260 0 3 
MG06389 AGCTTG 244 ~256 262 0 3 
MG08829 CCGCCC 237 - 281 255 4 3 
MGG 00590.5 MGG 01711.5 MGG 02569.5 MGG 02743.5 MGG 03150.5 MGG 03198.5 MGG 03597.5 MGG 04473.5 MGG 04802.5  MGG 05325.5 
0.0 START 00-A- START 0.0 ~A- START 0.0 START 90 START 0.0 START 0.0 START — 00 START 0.0 sarr 100 Ne START 
80] Dis d 120 I Ds 1720 bcon — 100 (CCCCCG)3 i I 990—H- Di-s i : i D 190- (GGC) 
2890—-DLI-S — 2470 DIE 195.0 DI-S 98.0 DI-S 1710 DI-S 770 Drs 
3210 DLE 294.0 —4— DI-S 266.0 —57— DI-S 22-A 
j S900- P DLE up EE Ü 409.0 ~} = (TCG CC) A 352.0 f- DI-E 
751.0 4- DI-E SUL ESISGATOSIS s30- -pe 5020- DI-E 487.0 f- DI-E 
6170-4- DI-E i i 
15909-H- aco. 9197] [en 865.0—-- (CATCGO)S 8460 —H- (AAQ9 
16120 ~| |^ TCCTTGYS 1503.0 ——END. 
16270 2] e rcerra 
2001.0 —— END xx 
4140—-- (AGG)6 
22460—— END. 1414.0 ~H- (AGG) 
1723.0 —À—END 
1852.0 —À— END 
2968.0 —H— (CGCCGG)3 
3443.0 (GTC 
3486079 END 23640—— END 
25670 
2627.0 -J— END 2621.0 
43560 —— END 2848.0—À— END 
MGG 06100.5 MGG 06387.5 MGG 06389.5 MGG 08178.5 MGG 08345.5 MGG 08829.5 MGG 09313.5 MGG 10590.5 MGG 10955.5 MGG 14350.5 
à 00 ~ START 0.0 ez START 00-7 START 00 ey START = z 00 ~g START START -e ST 
oo-fy-smRr Loap SAN 0 ee DO 0.0 —&- START S o $02Ó Dis 0.0 —5Pi— START 0.0—E]- START 
270- (GAGEO 2070] 4" DI-E ^ : e 2090- 革 -DIS 2700. L- DI-S 
3910 7- DLE 2900 == DI-S P EE 3310 = (6cGccays EIN MG 35 
687.0 -DI-E 6220—pi- DI-S sog Mi P i x 4330 DI-E 
934014 DI-E 40 -]- (CcGccoya -E $3.9 i ei 
eo | 9 684.0 cGccc3 3770-4- pis B60- DI-E 
1551.0 ff- DI-E 
17540 —À— END 
2291.0, | (CAAGCTS 
2324.0 >S END 1824.0 —À— END. 
2653.0 -H= accracys 
21560 —À— END 
2983.0 —À— END 
3191.0 END 2408.0 END 
25760 —- END 
32300 
43940 ~= (0G) 32520 
47910 -END 3653.0 —9— END. 











图 中 START 为 基因 的 5' 端 ， 





图 2 基因 中 的 SSR 与 功能 域 间 的 位 置 关系 
即 起 始 密 码 子 起 始 的 位 置 ， 但 未 包含 起 始 密 码 子 ，D1-S$、D2-S 和 D3-S 分 别 代 表 
各 功能 域 的 起 始点 ，D1-E、D2-E 和 D3-E 分 别 代表 各 功能 域 的 终止 点 ， 括 号 内 为 SSR 的 基 序 ， 
END 为 该 基因 的 3' 端 ， 即 终止 子 的 位 置 











括号 外 为 的 数字 为 SSR 重复 的 次 数 。 

















Fig.2 The relationship between SSR and functional domain 


The START means 5'-terminal or the location of start codon was excluding the base of start codon; DI-SD2-S and D3-S show the 


start site of functional domain, D1-E D2-E and D3-E show the end site of it; the motif of SSR was show in bracket; 


and the number out of the bracket means the repeats; the END means 3'-terminal of gene 
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的 幅度 ， 并 以 此 为 依据 在 各 基因 SSR 所 编码 的 
氨基酸 处 增加 或 减少 SSR 所 编码 的 氨基 酸 数量 
(增加 或 减少 最 大 SSR 重复 数量 ) ， 通 过 软件 An- 
theprot 预测 SSR 扩张 或 收缩 后 对 该 基因 二 级 结 
构 产 生 的 影响 (图 3)。 从 图 3 中 可 以 看 出 SSR 
重复 次 数 的 增加 或 减少 能 够 对 基因 多 个 位 点 处 的 
二 级 结构 产生 影响 ,这 些 影响 包括 片 层 、 螺 旋 、 
转角 和 卷曲 的 增加 或 减少 ， 以 及 这 些 结构 的 加 长 
或 缩短 。 例 如 在 基因 MGG00590 中 ， 当 SSR 减少 
15 次 重复 后 ， 引 起 了 该 基因 25 处 二 级 结构 发 生 




















3 讨论 


作者 通过 查找 和 分 析 稳 瘟病 菌 WD 功能 域 基 





MGG00590 


MGG01711 


MGG01711-4 


MGG01711+4 


MGG02743 


MGG02743-6 


MGG02743*6 


MGG03150 


MGG03150-3 


MGG03150A-- 





MGG03150B-- 


MGG03150M-3 


MGG06389 


MGG06389-3 


MGG08829 


MGG08829-3 





MGG08829*4 


图 3 通过 Antheprot (DPM) 预测 SSR 变异 对 含 WD 重复 功能 域 蛋 白 二 级 结构 的 影响 
红色 三 角 型 表示 发 生变 异 的 区 域 ， 蓝 色 标 识 为 a- 螺 旋 ， 绿 色 为 B- 转 角 ， 黄 色 为 B- 片 屋 ， 浅 蓝 色 为 卷 


Fig.3  Predicted SSR variation effecting on protein including WD repeats domain secondary structure by Antheprot ( DPM) 








因 编 码 区 和 调控 区 中 的 SSR 发 现 ， 这 些 基因 的 
调控 区 和 编码 区 中 均 含 有 丰富 的 SSR， 其 中 编码 
区 中 的 SSR 均 为 三 碱 基 SSR 或 六 碱 基 SSR， 且 G+ 
C 含量 较 高 的 SSR 所 占 的 比例 较 大 ， 这 与 李 成 云 
等 (2005) 对 稳 癌 病菌 阅读 框架 中 SSR 的 组 成 及 
其 分 布 特点 的 研究 结果 相同 。 而 且 在 WD 功能 域 
基因 编码 区 中 ，SSR 编码 的 亲 水 性 氨基 酸 出 现 的 
频率 远 高 于 玻 水 性 氨基 酸 出 现 的 频率 (362). E 
白质 的 二 级 结构 与 通过 对 WD 重复 功能 域 基因 中 
SSR 的 多 态 性 检测 结果 表明 : 含有 SSR 的 位 点 是 
易于 变异 的 。 而 且 通 过 软件 预测 稻 瘟 病菌 含 WD 
重复 功能 域 基因 中 SSR 的 扩张 或 收缩 对 该 蛋白 
二 级 结构 影响 的 结果 表明 编码 区 SSR 重复 次 数 
的 增加 或 减少 可 直接 影响 到 和 蛋白质 的 二 级 结构 。 





































































Variable regions were highlighted by red solid triangle; the blue, green, yellow and light blue mean a-helix , 


B-Turns B-sheet and coil, respectively 
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这 与 作者 对 稻 瘟 病菌 蛋 日 激酶 基因 中 SSR 易 变 
性 检测 的 结果 ( 刘 林 等 , 2010) 相似 。 因 此 和 蛋白 
质 二 级 结构 的 变化 对 蛋白质 的 空间 结构 会 产生 一 
定 的 影响 ， 从 而 影响 到 基因 的 功能 。 这 也 可 能 是 
稳 瘟 病菌 致 病 性 易于 变异 的 原因 之 一 。 但 是 ， 稳 
瘟病 菌 WD 功能 域 基因 中 SSR 的 变异 对 该 类 基 
功能 的 影响 以 及 其 与 稻 瘟 病菌 致 病 性 之 间 的 关 
系 还 有 待 进一步 的 研究 。 








[ 参 考 x 献 ] 


Amack JD, Mahadevan MS, 2001. The myotonic dystrophy expanded 
CUG repeat tract is necessary but not sufficient to disrupt C2C12 
myoblast differentiation [J]. Human Molecular Genetics, 10 
(18) : 1879—1887 
Benson G, 1999. Tandem repeats finder; a program to analyze DNA 
sequences [J]. Nucleic Acids Research, 27 ; 573—580 

Cerna D, Wilson DK, 2005. The structure of SifZp, a WD repeat 
protein functioning in the SET3 corepressor complex [J]. Jour- 
nal of Molecular Biology, 351 (4) : 923—835 

Cummings CJ, Zoghbi HY , 2000. Trinucleotide repeats; mechanisms 
and pathophysiology [J]. Annual Review of Genomics and Hu- 
mam Genetics, 1; 281—328 

Dean RA, Talbot NJ, Ebbole DJ et al., 2005. The genome sequence 
of the rice blast fungus Magnaporthe oryzae [J]. Nature, 434 
(7036) : 980—986 

Deléage G, Combet C, Blanchet C et al., 2001. ANTHEPROT:; An 

integrated protein sequence analysis software with client/server 
capabilities [J]. Computers in Biology and Medicine, 34 (4); 
259—267 

Hopfer U, Hopfer H, Jablonski K et al., 2006. The novel WD-repeat 

protein Morgl acts as a molecular scaffold for hypoxia-inducible 


factor prolyl hydroxylase 3 ( PHD3) [J]. The Journal of Biolog- 


ical Chemistry, 281 (13) : 8645—8655 

Lau C, Bachorik JL, Dreyfuss G, 2009. Gemin5-snRNA interaction 
reveals an RNA binding function for WD repeat domains []J]. 
Nature Srructural and. Molcular Biology, 16; 486—491 

Li CY (FX), Li JB (AHI), Zhou XG (HRE) et al., 


2005. Frequency and Distribution of Microsatellites in Open 














Reading Frame of Rice Blast Fungus, Magnaporthe grisea [J]. 
Chinese Journal Rice Science (中 国 水 稻 科学 ) , 19 (2): 167— 
173 

Li YC, Korol AB, Fahima T et al., 2004. Microsatellites within 
genes; structure, function, and evolution [J]. Molecular Biolo- 
gy Evolution, 21 (6) : 991—1007 

Liu HM ( 刘 红 美 ), Li XY (758638), Liu YG (XR), 2007. 
Functional analysis of several rice WD domain genes by RNA in- 
terference [J]. Journal of South China Agricultural University 
(华南 农业 大 学 学 报 ) , 28 (3) : 47—51 

Liu L ( 刘 林 ) , Li JB (Æ), Zhang Y (IK) et al., 2010. 
SSR variation in the protein kinase genes and it's effects on pro- 
tein structure of rice blast fungus Magnaporthe grisea [J]. Myco- 
systema. ( 菌 物 学 报 ), 29 (5) : 698—706 

Nakayama J, Saito M, Nakamura H et al., 1997. TLP1: a gene enco- 














ding a protein component of mammalian telomerase is a novel 
member of WD repeats family [J]. Cell, 88; 875—884 

Rocha EPC, Blanchard A, 2002, Genomic repeats, genome plasticity 
and the dynamics of Mycoplasma evolution [J]. Nucleic Acids 
Research , 30 (9) : 2031—2042 

Seznec H, Agbulut O, Sergeant N et al., 2001. Mice transgenic for 
the human myotonic dystrophy region with expanded CTG repeats 
display muscular and brain abnormalities [J]. Human Molecular 
Genetics , 10 (23) : 2717—2726 

Welcker M, Clurman BE, 2008. FBW7 ubiquitin ligase; a tumour 
suppressor at the crossroads of cell division, growth and differen- 
tiation [J]. Narure Reviews Cancer, 8; 83—93 

Zoghbi HY, Orr HT, 2000. Glutamine repeats and neurodegeneration 
[J]. Annual Review of Neuroscience, 23; 217—237 


